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Description 

This invention relates to the molecular cloning and characterization of the gene sequence coding for 
human rSlhe invention is also concerned with recombinant DNA techmques for the preparat.on of 

5 human relaxin. prorelaxin and preprorelaxin. 4 ..„i„.,<„4"i human aene codina for 

More specifically, this invention relates to an isolated and pur.f.ed ( clo-^d V humar ' .9™ ° 
prorelaxin, preprorelaxin. and the A and/or B and/or C pept.de cha.ns of ht - man 1 / e, ^ x,n ;/" e „ t ^ S in °' 
fsolat no and purifying the genes and methods for transferring the genes to and repl.cat.ng the genes.* a 
hosfcS The doned Senes are expressed by the host cell when fused with a host-expressable prokaryot.c 
,o ^r^^rSSi^l^Biu. useJ. in the production of human relaxin for ^^^^ 
The invention also relates to the peptides human relaxm. prortaxm and 
individual peptide chains which comprise these sequences and to modified forms > of these pe pt.des. 
The invention further relates to modified genes coding for the md.v.dual relaxm cha.ns and for the 

,5 ^ N^"^ number used in the fol.owing description are collected at the end of the 

deSC pio t nOTing work by Hisaw (1) suggested an important role for the peptide homone relaxin in mammals 

bonds which has led to speculation of a common ancestral gene for these hormones (2. 3). 
25 A ^ocess for the preparation of human relaxin from chorionic membrane has been d.sclosed .n 

D % / e7om 0 biS DNA techniques have been applied to the isolation -^J^^ 1 ^"^^^^^^; 
oorcine relaxins (6) (7). see also European Patent Application No. 0086649. Synthetic unaecamer 
SCdeotides prepared on the basis of amino acid sequence information, were used as P"™***'** 
so avo hesis of cDNA probes greatly enriched in relaxin cDNA sequences which identif.ed relaxin cDN I A. clones 
? XbTaZt derived f rom ovarian tissue. The . elaxin structural gene was found to code for a single chain 
preS preproinsulin in the overall configuration, i.e.. signal pept,de/B cha.n/C pept.de/ 

A Ch pig and rat preproretafens contain an unexpectedly large connecting peptide of 105 and 1M ^ues 
35 respectively "comparison to rat insulin with a C peptide of about 30 residues. A h.gh degree °f sequence 
homology in t£e C-peptide of rat and pig relaxin suggests a role beyond simply ensuring the correct 
SfsTphSe bond formation of the A and B chains. We predicted that 
- divergence aoDlvinq during evolution would have resulted in the C-pept.de region having a similarly high 
- IZIS^w^tomouZv in the human relaxin gene. Accordingly, as described ^^^^^ 
40 JKrobesbased'on the C-peptide region of procine rather than rat relaxin , ir .the r*^*^™^ 
relaxin gene because the accumulation of 'protein sequence data indicated that human prote.ns are .n 

no no ml le« diveraent from porcine than from rat proteins (8). 

9 AUhoug . U ha 9 s Seen the long term goal of several groups to determine the structure of human relaxm 
and so establish a route to clinical intervention in cases of difficult labour, the _l.rn.ted ava.lab.l.ty oi human 
45 ovarii Zing pregnancy has prevented direct amino acid sequence determ.nat.on. Our approach , was to 
scree^dS? ?o7?he human relaxin gene in a genomic library using a region of the , P° re ™ " ,a ™ ° D J£ 
a ra probe This approach resulted in the successful identification of genom.c clone from wh.ch the 
structure of the entire coding region of preprorelaxin has been determined. , .„,..„. 

8t Unow be'eved that either or both the presently-described gene : which we have , des.gnatec I HI and 
in* »w?" n«n« described in our copending European application No. EP — A 0112149 are expresseo m 
^uman rep^^^^ ov 9 ary and' p.acenta,and/or ^«™^*>«*" h "« ^ 

}° S, T , he b Sr , p r lite", 0 ™ryTwK^ ™st Hkely sites for 

expresso* °<S Jefaxln r^ateS g^ne? However, in view of the wide distribution of many ^V^ZZVe 

natue of connective tissue and influencing smooth muscle contract on We M"™^"?™ 0 ' bi widelv 
a«ne structures described in this and the copending patent appl.cat.on EP-A— 0112149 to be w.deiy 
d?suibute?rthe bodl we suggest that the relaxin peptides expressed from these genes w.l. play an 
t!S^^SSl^!Z in addition to their well documented hormonal function during reproduction. 
The following abbreviations are used in this description. 

m the relaxin aene described herein, being deduced from a genomic clone. 
Si -the" Sail ^g 9 ene described in copending^pp.ication No. EP-A-01 12149 being deduced from a 

cDNA clone. 
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A — Adenine 
T — Thymine 
G — Guanine 
C — Cytosine 
U — Uracil 



DNA — deoxyribonucleic acid 
RNA — ribonucleic acid 
cDNA — complementary DNA 

(enzymatically 
5 synthesized 

from an mRNA sequence) 
mRNA — messenger RNA 

The coding relationships between nucleotide sequence in DNA and amino acid sequence in protein are 
to collectively known as the genetic code, which is set out below. 
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The abbreviations used for the amino acids in the table are identified as follows. 



45 



SO 



55 



60 



Phenylalanine (Phe) 

Leucine (Leu) 

I so leucine (He) 

Methionine (Met) 

Valine (Val) 

Serine (Ser) 

Proline (Pro) 

Threonine (Thr) 

Alanine (Ala) 

Tyrosine (Tyr) 



Histidine (His) 
Glutamine (Gin) 
Asparagine (Asn) 
Lysine (Lys) 
Aspartic acid (Asp) 
Glutamic acid (Glu) 
Cysteine (Cys) 
Tryptophan (Try) 
Arginine (Arg) 
Glycine (Gly) 



Each 3-letter codon represented in the table, e.g., AUG, CAU (otherwise known as a deoxynucleotide 
55 triplet or nucleotide triplet) corresponds to a trinucleotide of mRNA, having a 5'-end on the left and a 3'-end 
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on the right. The letters stand for the purine or pyrimidine bases forming the nucleotide sequence. All DNA 
sequences given herein are those of the strand whose sequence corresponds to the mRNA sequence, with 
thymine (T) substituted for uracil (U). 

In the following discussion reference will be made to the accompanying drawings in which: 

Figure 1 is an abbreviated restriction enzyme map of the two genomic clones mentioned below; 

Figure 2 shows how to align figures 2a and 2b which when aligned give the mRNA sequence of the 
coding region of the human relaxin gene and the amino-acid sequence of human preprorelaxin; and 

Figure 3 shows a comparison of the human preprorelaxin and mRNA sequences with the 
corresponding sequences for porcine preprorelaxin. 

The original source of genetic material was a library of human genomic clones. Screening of this 
library using pig relaxin cDNA probes yielded two clones containing coding sequences of human relaxin. 

The mRNA sequence shown in Figures 2 and 3, was determined by the methods described hereinafter. 
It will be seen that a single intron of 3.4kb interrupts the coding region of the connecting (C) peptide. The 
structure of human preprorelaxin was deduced from the genomic sequence by comparison with the 
homologous structures of pig and rat relaxin. Confirmation of the A and B peptide chain structures has 
been provided by synthesis and chain recombination in vitro which produces a material which is 
biologically active in the uterine contraction assay. 

The mode of in vitro processing of the preprorelaxin is not yet fully known but by analogy with pig 
relaxin cleavage of the signal peptide would be expected to occur at the Ala^-Lys 1 bond. Similarly excision 
of the C peptide is predicted to occur at Leu 32 -Ser 33 and Arg 136 -Arg 137 , thus giving the B and A chains of 
respectively 32 and 24 residues. 

As noted in our studies on pig relaxin, thee are core sequences in the pig relaxin B and A chains which 
contain all the essential elements for biological activity. Our synthetic studies on the human relaxin chain 
show similar results, as set out in more detail hereinafter. 

According to one aspect of the present invention, there is provided a gene for the expression of human 
preprorelaxin. 

More specifically, this aspect of the invention provides a double-stranded DNA fragment for the 
expression of human preprorelaxin, which comprises a coding strand and a complementary strand 
corresponding to the complete mRNA (codons -25 to 160) sequence shown in Figure 2 of the 
accompanying drawings. 

The invention also includes^ any sub-unit of the preprorelaxin gene sequence described herein, or any 
equivalent of the said sequenc^or sub-unit. Among the sub-units to be included by this statement are 
genes which exclude non-coding regions, such as those shown in Figure 3, genes containing the individual 
structural genes coding for the signal peptide chain and the A, B and C chains of human preprorelaxin (see 
Figure 3) and any combinations of these chains, e.g., the genes for expressing the A and B peptide chains, 
separately or as prorelaxin (with the C chain). 

Thus according to another aspect of the present invention, there is provided a gene for the expression 
of human prorelaxin. 

More specifically, this aspect of the invention provides a double-stranded DNA fragment for the 
expression of human prorelaxin, which comprises a coding strand and a complementary strand 
corresponding to the codons numbered as 1 to 160 of the mRNA sequence shown in Figure 2 of the 
accompanying drawings. 

According to a further aspect of the present invention, there are provided genes for the separate 
expression of the A, B and C chains of human relaxin or any combination of two or more of the said chains. 

More specifically, this aspect of the invention provides double-stranded DNA fragments for the 
separate expression of the A and/or B and/or C chains of human relaxin, which comprise a coding strand 
complementary strand corresponding to the codons numbered 1 to 32, 33 to 136 and 137 to 160 of the 
RNA sequence shown in Figure 2 of the accompanying drawings. v 

he genes described above in addition to the codons specified may also include the appropriate "start"' 
stop" codons, i.e., AUG and UGA respectively (codons -26 and 161 in Figure 2). 
Those skilled in the art will appreciate that polymorphic forms of the geners may exist. Such forms are 
included in the present invention. 

The invention further includes the complements of the above sequences, sub-units or equivalents, and 
the corresponding RNA sequences, sub-units or equivalents. 

According to another aspect of the present invention there is provided a DNA transfer vector 
comprising the deoxynucleotide sequences corresponding to the genes defined above. 

As shown above, the genetic code contains redundancies, that is certain amino acids are coded for by 
more than one codon. Thus the invention includes deoxynucleotide sequences in which the codons 
depicted in the drawings, or their cDNA equivalents are replaced by other codons which code for the same 
amino-acidi 

furthermore, as already indicated above, peptides with relaxin activity may be produced which differ 
from the B and/or A chain structures of natural relaxin. Such differences may involve deletion of one or 
more amino acids and/or addition of further amino acids and/or substitution of different amino acids in the 
natural chains. 

Thus the invention also includes ge * and DNA transfer vectors as described above wherein one or 
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Figure 1). 
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AUG CCO CGC CUG OOC OOG OOC CAC COG COA GAA OUC OGU OUA 

==============. 

nir itni GCC AUU OGC GGC AUG AGC ACC UGG AGC AAA AGG UCU 
CAG AOU GCC AUU U ^ GUG KA 

========52==== 

============== 

GCA GAC AGC AAU CCU UCA GAA qca C UG UUU 

AAA UAU UGC UGfc 

XAA UGG AAG GAC GAU GUU AOU AAA OOA OGC GGC CGC GAA OOA 
Z Z "c Sg A«0 GCC AOO OGC GGC AOG AGC ACC UGC AGC 
^ AGG OCO CUG AGC CAG GAA GAO GCO CCU CAG ACA CCO AGA 
CCA GOG GCA GAA AOO GUA CCA OCC OOC AOC AAC AAA GAC ACA 

" Z Z "= CAG OAO GUA CCU GCA OUA AAG GAO UCC AAO 
r,m AGC 000 GAA GAA OUO AAG AAA COO AOO CGC AAO AGG CAA 
tT^A GCC GCA GAC AGC AAO CCU OCA GAA OOA AAA OAC OOA 
Z Z GAU Zo CAO OCU CAA AAA AAG AGA CGA CCC UAC GUG 
^ ... „_,, rifA xt m GGU UGU ACC AAA AGG 

GCA CUG UUU GAG AAA UGU UGC CUA AUU <*»u u 

UCU CUU GCU AAA UAU UGC UGA 
3 A DNA „„ 
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m—JUm. r ~ U „G «* CAC COO CUA GAA OOC 0 GU <~A 

A-Chain G „ UGC CUA AW cG0 

GUU CGC GCG CAG AOU GCC AO 
WVA AGG 0C0 COG 
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AGA CCA GOG GCA GAA 
&GC CAG GAA GAU =U CCO CAC ^ GAA ACO AOA AOO 

£ GUA CCA »CC «UC AOC AAC AAA CAV ^ ^ ^ 
»c AUG »0G GAA. UUC AUO GCU ^ CC A GAG CUA CAG 

=iss=s===-— — 

CAU OCU CAA AAA AAG AGA characterized 
iDNAhsvinotholoHowmg 

•""""^ «~r TCC ATC ACC AAA GAT GCA GAA 

GCA GAA ACC ATG CCA TCC TCC AT^ ^ „ 0 cc „ CAG GAG 

^ £ X Act £ « AGG CAA CCA TCA CTG AGA GAG 

CTA CAA CAA TCT GCA TCA AAG GAT TCG.^ ^ 

as claimed in any one notcl. ■« 'J, d 0NA ,„ gm .n. w,tb a m „, a „ „, part 
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^ ^^^^^^^^^^ 

fiZim i under cond t ons suitable for expression u. 

<c) a polypeptide in which in respect to iaj un« w 
"""to, . rt^Nl m which in -pec ,0 <a> on. • "S^^^^^rSSi 

W r-SMSX»»S B as - — ~,-ee .no . portion „, 

(b) a polypopllde having the amino acio IW^ „. .enlaced v«ith different amino acids, 
human HVraiaxin except ^^Z^t^Z^ 2 A B *" c °" e!0O " dS '° 

horr^ST-T^^ 

^wsrat.^^ - «• — 1 —~ and • pon " ,n ; 

porcine relaxin cDNA. mnrMna a DNA sequence encoding human H1 -preprorelaxin human 

17 An isolated DNA sequence comprising a dn^ s «^"*r deletion of one or more of the natural 

Hi-pro,*.*, o. human n-^.^^J^Z^^Zw consisting of A chain ammo 

£!£. Mid poptid. h.,in, n^'"^;"";: saguehc. encoding hum.n Hl-P'OP-oretoln human 

pe^de^p^^ 

end a B chain .elected horn th. group "^".'iVpeptida having human Hl-relaxin *• 

- ~J!!&££22^££»' ^ Human-H-pieproreiaxin activity, .aid polypeptide 
'^XS^*^^'^ sequence shown in Figure 2 A end B tha, correspono. to 

rss r,33ssi5i «- tj^^s^^^ — d,He — lno 

(cl a polypeptide in which in respect to {al one ot mo 
. polypeptide in which ,n respect to (a, 

Mte r.^,Cp»n, 9 r;m,no add sequence ahown ,n Figure 2 A end B the. -respond, to 

65 human H1-prorelaxin; 
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(b) a polypeptide that in respect to <a) is deficient in one or more amino acids; . . nr% 

!c) a polypeptide In which in respect to (a) one or more amino acids are replaced with different amino 

(d) a polypeptide in which in respect to (a) one or more amino acids are i added lto_ «J wenw or 
* e a fSionpolypeptide comprising an amino acid sequence cons.st.ng of all or part o 1 the amino acid 

sequence of human Hl-prorelaxin shown in Figure 2 A and B as its C-term,nal sequence and a portion of a 

» ^^tw^T^Xoac^ sequence shown in Figure 2 A and B that corresponds to 

human Hl-relaxin; . . „ .. . 

(b) a polypeptide that in respect to (a) is deficient in one or more amino acids. 

(c) a polypeptide in which in respect to {a) one or more amino acids are replaced with d.fferent ammo 

'5 aC ' d (d) a polypeptide in which in respect to (a) one or more amino acids are added to the sequence; or _ 
e a fusioVpolVPeptide comprising an amino acid sequence consisting of all or Partoftheamn ac.d 
sequence of human Hl-relaxin shown in Figure 2 A and B as its C-termmal sequence and a portion of a 
prokaryotic protein as its N-terminal sequence. 

Patentanspruche 

1 DNA-Fragment. das menschllches Hl-Prfiprorelaxin codiert dadurch ^nmelc^ex, d^ es einen 
codierenden S?anJ und einen komplementfiren Strang, entsprechend der folgenden vollstand.gen mRNA- 
Sequenz, umfaBt: 

AUG CCU CGC CUG UUC UUG UUC CAC CUG CUA GAA UUC UGU UUA 
CUA CUG AAC CAA UUU UCC AGA GCA GUC GCG GCC AAA UGG AAG 
GAC GAU GUU AUU AAA UUA UGC GGC CGC GAA UUA GUU CGC GCG 
30 CAG AUU GCC AUU UGC GGC AUG AGC ACC UGG AGC AAA AGG UCU 

CUG AGC CAC^GAA GAU GCU CCU CAG ACA CCU AGA CCA GUG GCA 
GAA AUU GUA CCA UCC UUC AUC AAC AAA GAU ACA GAA ACU AUA 
as * AUU AUC AUG UUG GAA UUC AUU GCU AAU UUG CCA CCG GAG CUG 

AAG GCA GCC CUA UCU GAG AGG CAA CCA UCA UUA CCA GAG CUA 
CAG CAG UAU GUA CCU GCA UUA AAG GAU UCC AAU CUU AGC UUU 
GAA GAA UUU AAG AAA CUU AUU CGC AAU AGG CAA AGU GAA GCC 
GCA GAC AGC AAU CCU UCA GAA UUA AAA UAC UUA GGC UUG GAU 
ACU CAU UCU CAA AAA AAG AGA CGA CCC UAC GUG GCA CUG UUU 
GAG AAA UGU UGC CUA AUU GGU UGU ACC AAA AGG UCU CUU GCU 
AAA UAU UGC UGA 

o DNA-Fraament das menschliches H1-Prorelaxin codiert. dadurch gekennzeichnet, daS es einen 
codierenSen 'stra^runreirnTomp.ementaren Strang, entsprechend der folgenden mRNA-Sequenz. 
so umfa&t: 
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AAA 


UGG 


AAG 


GAC 


GAU 


GUU 


AUU 


AAA 


UUA 


UGC 


GGC 


CGC 


GAA 


UUA 


GUU 


CGC 


GCG 


CAG 


AUU 


GCC 


AUU 


UGC 


GGC 


AUG 


AGC 


ACC 


UGG 


AGC 


AAA 


AGG 


UCU 


CUG 


AGC 


CAG 


GAA 


GAU 


GCU 


CCU 


CAG 


ACA 


CCU 


AGA 


CCA 


GUG 


GCA 


GAA 


AUU 


GUA 


CCA 


UCC 


UUC 


AUC 


AAC 


AAA 


GAU 


ACA 


GAA 


ACU 


AUA 


AUU 


AUC 


AUG 


UUG 


GAA 


UUC 


AUU 


GCU 


AAU 


UUG 


CCA 


CCG 


GAG 


CUG 


AAG 


GCA 


GCC 


CUA 


UCU 


GAG 


AGG 


CAA 


CCA 


UCA 


UUA 


CCA 


GAG 


CUA 


CAG 


CAG 


UAU 


GUA 


CCU 


GCA 


UUA 


AAG 


GAU 


UCC 


AAU 


CUU 


AGC 


UUU 


GAA 


GAA 


UUU 


AAG 


AAA 


CUU 


AUU 


CGC 


AAU 


AGG 


CAA 


AGU 


GAA 


GCC 


GCA 


GAC 


AGC 


AAU 


CCU 


UCA 


GAA 


UUA 


AAA 


UAC 


UUA 
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w 



============== 

OCO CUU GCU AAA UAU OGC UGA • es DNA Fragment ist, welches die Signal-, 

SJuenien, die unten angegeben s.nd, umfaBt. 

^ 00 CCU coc cue uuc uug uuc cac = - - - UGU « 

CO* COG AAC CAA UUU OCC AGA GCA GUC GCG GCC 



A-Kette 



B-Kette 

25 

C-Kette 

30 ' 



CG A CCC UAC CUG =CA CUG UUU GAG AAA UCU UGC =0A AUU 00. 
W ACC AAA AGG UCU CUU GCU AAA UAU UGC 

============== 

AAA AGG UCO CUG 



35 



40 



. „^ »r» CCU AGA CCA GUG GCA GAA 
AGC CAG GAA GAO GCU CCU CAG ACA CCU AGA ^ AUU 

AUU GUA CCA OCCUUC AUC AAC AAA GAU ACA ^ ^ ^ 

AUC *» <"» <^.UUC AUU GCU AAU UU^ ^ ^ CUA CAG 

GCA GCC CUA UCU GAG AGG CAA AGC ««U GAA 

- - z z r uu Tu £ - S - - - « «* 

CAO UCO CAA AAA AAG AGA ^ ^ ^ ^ ^ ^ 

"g "g "a ACA TTG TCT GAG AGG CAA CCA TCA CTG AGA GAG 
CTA CAA CAA TCT GCA TCA AAG GAT TCG. 
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daB es das Umsetzen der passenden Desoxynukleotidsequenz des besagten DNA-Fragments mit einem 
DNA-Molekul umfaBt, das durch Schneider) eines Transfervektors mit einem Restriktionsenzym hergestellt 
worden ist. 

11. Verfahren zur Herstellung eines Fusionsproteins, das eine Aminosauresequenz umfaBt, die 

5 insgesamt oder teilweise aus einer Aminosauresequenz von menschiichem H1 -Praprorelaxin als seiner C- \ 
terminalen Sequenz und eines Teils eines prokaryontischen Proteins als seiner N-terminalen Sequenz J 
besteht, dadurch gekennzeichnet, dad es das Inkubieren eines Mikroorganismus umfaBt, der mit einem \ 
Expressions-Transfervektor transformiert ist, welcher die passende Desoxynukleotidsequenz umfaBt. • j 

12. Verfahren zu Synthese von menschiichem H1-Prorelaxin, welches die A- und B-Peptide, getrennt i ! 
io voneinander durch ein C-Peptid, umfaBt, dadurch gekennzeichnet, daB es das Inkubieren eines 

Mikroorganismus, transformiert mit einem Expressions-Transfervektor, der ein DNA-Fragment umfaBt, 
das fur besagtes menschliches Prorelaxin nach Anspruch 2 kodiert, unter fur die Expression besagten DNA- \ 
Fragments geeigneten Bedingungen, und das Reinigen menschlichen Prorelaxins aus dem Lysat oder [ 
Kulturmedium von besagtem Mikroorganismus umfaBt. 
is 13. Polypeptid mit der Aktivitat von menschiichem H1-Praprorelaxin, wobei besagtes Polypeptid | 
ausgewahlt ist aus der folgenden Gruppe: 

(a) ein Polypeptid mit der in Figur 2 A und B dargesteliten Aminosauresequenz, die menschiichem H1- | 
Praprorelaxin entspricht; ■ \ 

(b) ein Polypeptide dem im Hinblick auf (a) eine oder mehrere Aminosauren fehlen; f 
20 (c) ein Polypeptid, in dem in Hinblick auf (a) eine oder mehrere Aminosauren durch andere ! 

Aminosauren ersetzt sind; f 
ein Polypeptid, in dem im Hinblick auf (a) eine oder mehrere Aminosauren zur Sequenz hinzugefugt !' 
sind; oder 

(e) ein Fusions-Polypeptid, das eine Aminosauresequenz umfaBt. die insgesamt oder teilweise aus der 
25 in Figur 2 A und B dargesteliten Aminosauresequenz von menschiichem HI -Praprorelaxin als seiner C- 
terminalen Sequenz und einem Teil eines prokaryontischen Proteins als seiner N-terminalen Sequenz 
besteht. 

14. Polypeptid mit der Aktivitat von menschiichem Hl-Prorelaxin, wobei besagtes Polypeptid 
ausgewahlt ist aus der folgenden Gruppe: ' 

3o (a) ein Polypeptid mit der in Figur 2 A und B dargesteliten Aminosauresequenz, die menschiichem H1- 
Proretaxin entspricht; 

(b) ein Polypeptid, dem im Hinblick auf (a) eine oder mehrere Aminosauren fehlen; 

(c> ein Polypeptid, TH** dem in Hinblick auf (a) eine oder mehrere Aminosauren durch andere 
Aminosauren ersetzt *5ihc*$ 

35 (d) ein Polypeptid, in dem im Hinblick auf (a) eine oder mehrere Aminosauren zur Sequenz hinzugefugt 
sind; oder 

(e) ein Fusions-Polypeptid, das eine Aminosauresequenz umfaBt, die insgesamt oder teilweise aus der 
in Figur 2 A und B dargesteliten Aminosauresequenz von menschiichem H1 -Prorelaxin als seiner C- 
terminalen Sequenz und einem Teil eines prokaryontischen Proteins als seiner N-terminalen Sequenz 
40 besteht. 

15. Polypeptid mit der Aktivitat von menschiichem H1 -Relaxin, wobei besagtes Polypeptid ausgewahlt 
ist aus der folgenden Giuppe: 

(a) ein Polypeptid mit der in Figur 2 A und B dargesteliten Aminosauresequenz, die menschiichem H1- | 
Relaxin entspricht, mit der Ausnahme, daft ihm eine oder mehrere Aminosauren fehlen; ' 
45 (b) ein Polypeptid mit der in Figur 2 A und B dargesteliten Aminosauresequenz, die menschiichem H1- 
Relaxin entspricht, mit der Ausnahme, daB eine Oder mehrere Aminosauren durch andere Aminosfluren 
ersetzt sind; 

<c) ein Polypeptid mit der in Figur 2 A und B dargesteliten Aminosauresequenz, die menschlichen HI- 
Relaxin entspricht, mit der Ausnahme, daB eine oder mehrere Aminosauren zur Sequenz hinzugefugt sind; 
so oder 

(d) ein Fusions-Polypeptid, daB eine Aminosauresequenz umfaBt, die insgesamt oder teilweise aus der 
in Figur 2 A und B dargesteliten Aminosauresequenz von menschiichem HI -Relaxin als seiner C-terminalen 
Sequenz und einem Teil eines prokaryontischen Proteins als seiner N-terminalen Sequenz besteht. 

16. Verfahren zur Isolierung eines chromosomalen Relaxin-Gens das ein menschliches Hl-Relaxin 
55 nach Anspruch 15 codiert, dadurch gekennzeichnet, daB es das Screenen einer Genombibliothek unter 

Verwendung einer Untereinheit der Schweine-Relaxin-cDNA als Sonde umfaBt. 

17. Isolierte DNA-Sequenz, die eine DNA-Sequenz umfaBt, welche menschliches H1 -Praprorelaxin, 
menschliches H1-Prorelaxin oder menschliches H1-Relaxin codiert, das durch Deletion einer oder mehrerer 
naturlicher Codons modifiziert worden ist, um ein Peptid zu codieren, das eine A-Kette, die ausgewdhlt ist 

60 aus der Gruppe,. die aus der A-Ketten-Aminosauren 1 — 24 bis 3 — 24 besteht, und eine B-Kette, die 
ausgewahlt ist aus der Gruppe, die aus B-Ketten-Aminosauren 1 — 32 bis 4 — 23 besteht, umfaBt, wobei 
besagtes Peptid die Aktivitat von menschiichem Hl-Relaxin besitzt. 

18. Isolierte DNA-Sequenz, die eine DNA-Sequenz umfaBt, die menschliches H1-Pr§prorelaxin, 
menschliches H1 -Prorelaxin oder menschliches H 1 -Relaxin codiert, das durch Ersetzen einer oder mehrerer 

65 naturlicher Codons durch Codons, die fur andere Aminosauren codieren als fur diejenigen, die durch das 
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naturliche Codons codiert werden, modifiziert worden sind, um ein Peptid zu codieren, das eine A-Kette, 
die ausgewdhlt ist aus der Gruppe, die aus A-Ketten-Aminos8uren 1—24 bis 3 — 24 besteht, und eine B- 
Kette, die ausgewahlt ist at** der Gruppe, die aus B-Ketten-Aminosauren 1 — 32 bis 4 — 23 besteht, umfaSt, 
wobei das Met 24 de 8-Kette durch Ala, Val, Gly Oder Ser ersetzt ist, wobei besagtes Peptid die Aktivitat von 
5 m nschlichem Hl-Relaxin besitzt. 

19. DNA-Fragment, das ein Polypeptid mit der Aktivitat von menschlichem Hl-Praprorelaxin codiert, 
wobei besagtes Polypeptid ausgewahlt ist aus der fotgenden Gruppe: 

(a) ein Polypeptid mit der in Figur 2 A und B dargestellten Aminosauresequenz, die menschlichem Hl- 
Praprorelaxin entspricht; 
jo (b) ein Polypeptid, dem im Hinhlick auf (a) eine Oder mehrere Aminosauren fehlen; 

(c) ein Polypeptid, in dem im Hinblick auf (a) eine Oder mehrere Aminosauren durch andere 
Aminosauren ersetzt sind; 

(d) ein Polypeptid, in dem im Hinblick auf (a) eine Oder mehrere Aminosauren zur Sequenz hinzugefugt 
sind; oder 

'5 (e) ein Fusions-Polypeptid, das eine Aminosauresequenz umfaftt, die insgesamt oder teilweise aus der 
in Figur 2 A und B dargestellten Aminosauresequenz von menschlichem H1-Praprorelaxin als seiner C- 
terminalen Sequenz und einem Teil eines prokaryontischen Proteins als seiner N-terminalen Sequenz 
besteht. 

20. DNA-Fragment, das ein Polypeptid mit der Aktivitat von menschlichem H1-Prorelaxin codiert, 
20 wobei besagtes Polypeptid ausgewahlt ist aus der folgenden Gruppe: 

(a) ein Polypeptid mit der in Figur 2 A und B dargestellten Aminosauresequenz, die menschlichem H1- 
Prorelaxin entspricht; 

(b) ein Polypeptid, dem im Hinblick auf (a) eine oder mehrere Aminosauren fehlen; 

(c) ein Polypeptid, in dem im Hinblick auf (a) eine oder mehrere Aminosauren durch andere 
25 Aminosauren ersetzt sind; 

(d) ein Polypeptid, in dem im Hinblick auf (a) eine oder mehrere Aminosauren zur Sequenz hinzugefugt 
sind; oder 

(e) ein Fusions-Polypeptid, das eine Aminosauresequenz umfaftt, die insgesamt oder teilweise aus der 
in Figur 2 A und B dargestellten Aminosauresequenz von menschlichem Hl-Prorelaxin als seiner C- 

30 terminalen Sequenz und einem Teil eines prokaryontischen Proteins als seiner N-terminalen Sequenz 
besteht. 

21. Isoliertes DNA-Fragment, das ein Polypeptid mit der Aktivitat von menschlichem Hl-Relaxin 
codiert, wob'ji besagtes PolypeptfcJ ausgewahlt ist aus der folgenden Gruppe: 

(a) ein Polypeptid mit der in figur 2 A und B darqestellten Aminosauresequenz, die menschlichem H1- 
35 Relaxin entspricht, 

(b) ein Polypeptid, dem im Hinblick auf (a) eine oder mehrere Aminosauren fehlen; 

(c) ein Polypeptid, dem im Hinblick auf (a) eino odor mehrero Aminosauren durch andere Aminosauren 
ersetzt sind; 

(d) ein Polypeptid, in dem im Hinblick auf (a) eine oder mehrere Aminosauren zur Sequenz hinzugefugt 
40 sind; oder 

(e) ein Fusions-Polypeptid, das eine Aminosauresequenz umfaftt, die insgesamt oder teilweise aus der 
in Figur 2 A und B dargestellten Aminosauresequenz von menschlichem H1 -Relaxin als seiner C-terminalen 
Sequenz und einem Teil eines prokaryontischen Proteins als seiner N-terminalen Sequenz besteht. 

45 Revendications 

1. Fragment d'ADN codant pour la preprorelaxine-H1 humaine, caracterise en ce qu'il comprend un 
brin codant et un brin complementaire correspondant a la sequence complete d'ARNm suivante: 
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AUG 


ceo 


CGC 


CUG 


UUC 


UUG 


UUC 


CAC 


CUG 


CUA 


GAA 


UUC 


UCU 


UUA 


CUA 


CUG 


AAC 


CAA 


UUU 


UCC 


AGA 


GCA 


GUC 


GCG 


GCC 


AAA 


UGG 


AAG 


GAC 


GAU 


GUU 


AUU 


AAA 


UUA 


UGC 


GGC 


CGC 


GAA 


UUA 


GUU 


CGC 


GCG 


CAG 


AUU 


GCC 


AUU 


UGC 


GGC 


AUG 


AGC 


ACC 


UGG 


AGC 


AAA 


AGG 


UCU 


CUG 


AGC 


CAG 


GAA 


GAU 


GCU 


ecu 


CAG 


ACA 


ecu 


AGA 


CCA 


GUG 


GCA 


GAA 


AUU 


GUA 


CCA 


UCC 


UUC 


AUC 


AAC 


AAA 


GAU 


ACA 


GAA 


ACU 


AUA 


AUU 


AUC 


AUG 


UUG 


GAA 


UUC 


AUU 


GCU 


AAU 


UUG 


CCA 


CCG 


GAG 


CUG 


AAG 


GCA 


GCC 


CUA 


UCU 


GAG 


AGG 


CAA 


CCA 


UCA 


UUA 


CCA 


GAG 


CUA 


CAG 


CAG 


UAU 


GUA 


ecu 


GCA 


UUA 


AAG 


GAU 


UCC 


AAU 


CUU 


AGC 


UUU 


GAA 


GAA 


UUU 


AAG 


AAA 


cuu 


AUU 


CGC 


AAU 


AGG 


CAA 


AGU 


GAA 


GCC 
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GCA 


GAC 


AGC 


AAU 


ecu 


UCA 


GAA 


UUA 


AAA 


UAC 


UUA 


GGC 


UUG 


GAU 


ACU 


CAU 


UCU 


CAA 


AAA 


AAG 


AGA 


CGA 


ccc 


UAC 


GUG 


GCA 


CUG 


UUU 


GAG 


AAA 


UGU 


UGC 


CUA 


AUU 


GGU 


UGU 


ACC 


AAA 


AGG 


UCU 


CUU 


GCU 


AAA 


UAU 


UGC 


UGA 






















Fragment d'ADN codant pour la prorelaxine-HI humaine, caracterise en ce qu'il compi 
et un brin complementaire correspondant a la sequence d'ARNm suivante: 


AAA 


UGG 


AAG 


GAC 


GAU 


GUU 


AUU 


AAA 


UUA 


UGC 


GGC 


CGC 


GAA 


UUA 


GUU 


CGC 


GCG 


CAG 


AUU 


GCC 


AUU 


UGC 


GGC 


AUG 


AGC 


ACC 


UGG 


AGC 


AAA 


AGG 


UCU 


CUG 


AGC 


CAG 


GAA 


GAU 


GCU 


ecu 


CAG 


ACA 


ecu 


AGA 


CCA 


GUG 


GCA 


GAA 


AUU 


GUA 


CCA 


UCC 


UUC 


AUC 


AAC 


AAA 


GAU 


ACA 


GAA 


ACU 


AUA 


AUU 


AUC 


AUG 


UUG 


GAA 


UUC 


AUU 


GCU 


AAU 


UUG 


CCA 


CCG 


GAG 


cue 


AAG 


GCA 


GCC 


CUA 


UCU 


GAG 


AGG 


CAA 


CCA 


UCA 


UUA 


CCA 


GAG 


CUA 


CAG 


CAG 


UAU 


GUA 


ecu 


GCA 


UUA 


AAG 


GAU 


UCC 


AAU 


CUU 


AGC 


UUU 


GAA 


GAA 


UUU 


AAG 


AAA 


CUU 


AUU 


CGC 


AAU 


AGG 


CAA 


AGU 


GAA 


GCC 


GCA 


GAC 


AGC 


AAU 


ecu 


UCA 


GAA 


UUA 


AAA 


UAC 


UUA 


GGC 


UUG 


GAU 


ACU 


CAU 


UCU 


CAA 


AAA 


AAG 


AGA 


CGA 


CCC 


UAC 


GUG 


GCA 


cue 


UUU 


GAG 


AAA 


UGU 


UGC 


CUA 


AUU 


GGU 


UGU 


ACC 


AAA 


AGG 


UCU 


CUU 


GCU 


AAA 


UAU 


UGC 


UGA 

















3. Fragment d'ADN selon la revendication 2, consistent en un fragment d'ADN bicat£naire codant pour 
les chaines peptidiques signal. A, B ou C de la pr6prorelaxine-H1 humaine, ou pour une combinaison d'au 
moins deux de ces chains, caract6ris6 en ce qu'il comprend un brin codant et un brin complementaire 
correspondant d la sequence d'ARNm appropri6e, ou A une combinaison des sequences d'ARNm 
mentionn6es ci-dessous? 

Peptide signal 



AUG 


ecu 


CGC 


CUG 


UUC 


UUG 


UUC 


CAC 


CUG 


CUA 


GAA 


UUC 


UGU 


UUA 


CUA 


CUG 


AAC 


CAA 


UUU 


UCC 


AGA 


GCA 


GUC 


GCG 


GCC 








Chaine A 




























CGA 


CCC 


UAC 


GUG 


GCA 


CUG 


UUU 


GAG 


AAA 


UGU 


UGC 


CUA 


AUU 


GGU 


UGU 


ACC 


AAA 


AGG 


UCU 


CUU 


GCU 


AAA 


UAU 


UGC 










Chatne B 




























AAA 


UGG 


AAG 


GAC 


GAU 


GUU 


AUU 


AAA 


UUA 


UGC 


GGC 


CGC 


GAA' 


UUA 


GUU 


CGC 


GCG 


CAG 


AUU 


GCC 


AUU 


UGC 


GGC 


AUG 


AGC 


ACC 


UGG 


AGC 


AAA 


AGG 


UCU 


CUG 






















Chaine C 




























AGC 


CAG 


GAA 


GAU 


GCU 


ecu 


CAG 


ACA 


ecu 


AGA 


CCA 


GUG 


GCA 


GAA 


AUU 


GUA 


CCA 


UCC 


UUC 


AUC 


AAC 


AAA 


GAU 


ACA 


GAA 


ACU 


AUA 


AUU 


AUC 


AUG 


UUG 


GAA 


UUC 


AUU 


GCU 


AAU 


UUG 


CCA 


CCG 


GAG 


CUG 


AAG 


GCA 


GCC 


CUA 


UCU 


GAG 


AGG 


CAA 


CCA 


UCA 


UUA 


CCA 


GAG 


CUA 


CAG 


CAG 


UAU 


GUA 


ecu 


GCA 


UUA 


AAG 


GAU 


UCC 


AAU 


CUU 


AGC 


UUU 


GAA 


GAA 


UUU 


AAG 


AAA 


CUU 


AUU 


CGC 


AAU 


AGG 


CAA 


AGU 


GAA 


GCC 


GCA 
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GAC AGC AAU CCU UCA GAA UUA AAA UAC UUA GGC UUG GAU ACU 
CAU UCU CAA AAA AAG AGA 

4. Procede de production d'un fragment d'ADN selon Tune quelconque des revendications 1 d 3, 
caracterise en ce qu'on crible une banque de clones de genes en employant comme sonde, un fragment 
d'ADNc de relaxine porcine ayant la sequence nu ;!6etidique suivante qui correspond aux aminoacides 45 £ 
95 du peptide C correspondant: 



GCA 


GAA 


ACC 


ATG 


CCA 


TCC TCC ATC ACC AAA GAT GCA 


GAA 


ATC 


TTA 


AAG 


ATG 


ATG 


TTG GAA TTT GTT CCT AAT TTG 


CCA 


CAG 


GAG 


CTG 


AAG 


GCA 


ACA TTG TCT GAG AGG CAA CCA 


TCA 


CTG 


AGA 


GAG 


CTA 


CAA 


CAA TCT GCA TCA AAG GAT TCG 





5. Vecteur de transfert d'ADN, caracterise en ce qu'il contient des sequences de desoxynucleotides 
d'ADNc, correspondant d un fragment selon Tune quelconque des revendications H3. 

6. Fragment d'ADN ou vecteur de transfert d'ADN selon I'une quelconque des revendications 1 a 3 et 5, 
caracterise en ce qu'un ou plusieurs codons naturels ou leurs ADNc Equivalents de ces fragments d'ADN, 
sont remplac6s par un autre codon qui code pour le me me aminoacide. 

7. Vecteur de transfert d'ADN selon I'une quelconque des revendications 5 et 6, caracterise en ce qu'il 
est un plasmide bactdrien. 

8. Vecteur de transfert d'ADN selon I'une quelconque des revendications 5 d 7, consistant en un ADN 
de bacteriophage. 

9. Cellule transformed par un vecteur de transfert selon I'une quelconque des revendications 5 £ 8. 

10. Procede de preparation d'un vecteur de transfer* d'ADN destine £ Stre employe pour maintenir et 
repliquer un fragment d'ADN selon I'une quelconque des revendications 1 d 3 et 6, caracterise en ce qu'on 
fait reagir la sequence de desoxynucleotides appropriee dudit fragment d'ADN, avec une molecule d'ADN 
pr6paree par clivage d'un vecjeur de transfert avec une enzyme de restriction. 

11. Procede de preparation d'une proteine fusionn^e, comprenant une sequence d'aminoacides 
consistant en totalite ou en partie en la sequence d'aminoacides de la pr6prorelaxine-H1 humaine formant 
sa sequence C-terminate, et une partie d'une proteine procaryote formant sa sequence N-terminale, 
caracterise en ce qu'on incube un micro-organisme transforme par un vecteur de transfert d'expression 
comprenant la sequence de desoxynucleotides appropriee. 

12. Procede de synthase de la prorelaxine-H1 humaine comprenant les peptides A et B separes I'un de 
I'autre par un peptide C, caracterise en ce qu'on incube un micro-organisme transforme par un vecteur de 
transfert et d'expression comprenant un fragment d'ADN codant pour la prorelaxine humaine defini dans 
la revendication 2, dans des conditions appropriees pour permettre ('expression dudit fragment d'ADN, et 
on purifie la prorelaxine humaine h partir du lysat ou du milieu de culture de ce micro-organisme. 

13. Polypeptide ayant I'activite de la preprorelaxine-H1 humaine, ce polypeptide 6tant choisi psrmi le 
groupe suivant: 

(a) un polypeptide ayant la sequence d'aminoacides illustree sur les figures 2A et 2B, correspondant h 
la pr6prorelaxine-H1 humaine; 

(b) un polypeptide correspondant au polypeptide (a) avec un ou plusieurs aminoacides en moins; 
<c> un polypeptide correspondant au polypeptide (a) dans lequef un ou plusieurs aminoacides sont 

rem places par des aminoacides differents; 

(d) un polypeptide correspondant au polypeptide (a) h la sequence duquel un ou plusieurs 
aminoacides sont ajoutes; ou 

(e) un polypeptide fusionne comprenant une sequence d'aminoacides consistant en totalite ou en 
partie en la sequence d'aminoacides de la preprorelaxine-H1 humaine illustree sur les figures 2A et 2B 
formant sa sequence C-terminale, et une partie d'une proteine procaryote formant sa sequence N- 
terminale. 

14. Polypeptide ayant I'activite de la prorelaxine-HI humaine, ce polypeptide etant choisi parmi le 
groupe suivant: 

(a) un polypeptide ayant la sequence d'aminoacides illustree sur les figures 2A et 2B, correspondant h 
la prorelaxine-H1 humaine; 

(b) un polypeptide correspondent au polypeptide (a) avec un ou plusieurs aminoacides en moins; 
(c> un polypeptide correspondant au polypeptide (a) dans lequel un ou plusieurs aminoacides sont 

remplaces par des aminoacides differents; 

(d) un polypeptide correspondant au polypeptide (a) h la sequence duquel un ou plusieurs 
aminoacides sont ajoutes; ou 

(e) un polypeptide fusionne comprenant une sequence d'aminoacides consistant en totalite ou en 
partie, en la sequence d'aminoacides de la prorelaxine-H1 humaine illustree sur les figures 2A et 2B, 
formant sa sequence C-terminale, et une partie d'une proteine procaryote formant sa sequence N- 
terminale. 
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15. Polypeptide ayant I'activite de la relaxine-HI humaine, ce polypeptide etant choisi parmi le groupe 
suivant: 

(a) un polypeptide ayant la sequence d'aminoacides illustree sur les figures 2A et 2B, correspondent ft 
la relaxine-H1 humaine avec un ou plusieurs aminoacides en moins; 

5 (b) un polypeptide ayant la sequence d'aminoacides illustree sur les figures 2A et 2B correspondent ft 

la relaxine-H1 humaine dans laquefle un ou plusieurs aminoacides sont remplac6s par des aminoacides 
differents; 

(c) un polypeptide ayant la sequence d'aminoacides illustree sur les figures 2A et 2B, correspondant ft 
la relaxine-H1 humaine ft la sequence de laquelle un ou plusieurs aminoacides sont ajoutes; ou 
jo (d) un polypeptide fusionnft comprenant une sequence d'aminoacides consistent en totality ou en 

partie, en la sequence d'aminoacides de la relaxine-H1 humaine illustree sur les figures 2A et 2B, formant 
sa sequence C-terminale, et une partie d'une proline procaryote formant sa sequence C-terminale. 

16. Procede d'isotement d'un gftne chromosomique de relaxine, codant pour une relaxine-HI humaine 
selon la revendication 15, caracteris6 en ce qu'on crible une banque de genes en employant comme sonde, 

15 une sous-unite de I'ADNc de la relaxine porcine. 

17. Sequence d'ADN isolee, comprenant une sequence d'ADN codant pour la preprorelaxine-HI 
humaine, la prorelaxine-H1 humaine ou la relaxine-H1 humaine, qui a 6tft modififte par deletion d'un ou 
plusieurs des codons naturels, afin de coder pour un peptide comprenant une chaine A choisie parmi les 
sequences d'aminoacides de chaine A 1 — 24 ft 3 — 24, et une chaine B choisie parmi les sequences 

20 d'aminoacides de chaine B 1 — 32 ft 3 — 23, ce peptide ayant I'activite de la relaxine-H1 humaine. 

18. Sequence d'ADN isolee, comprenant une sequence d'ADN codant pour la prepro;elaxine-H1 
humaine, la prorelaxine-HI humaine ou la relaxine-H1 humaine, qui a ete modifiee en remplagant un ou 
plusieurs des codons naturels, par des codons qui codent pour des aminoacides autres que ceux codes par 
le codon naturel, afin de coder pour un peptide comprenant une chaine A choisie parmi les sequences 

; 25 d'aminoacides de chaine A 1 — 24 ft 3 — 24, et une chaine B choisie parmi les sequences d'aminoacides de 
' chaine B 1 — 32 ft 4 — 23, le rgsidu Met 24 de la chaine B 6tant remplace par un residue Ala, Val, Gly ou Ser, et 
ce peptide ayant I'activite de la relaxine-H1 humaine. 

19. Fragment d'ADN codant pour un polypeptide ayant I'activite de la preprorelaxine-HI humaine, ce 
\ polypeptide 6tant choisi parmi le groupe suivant: 

f 30 (a) un polypeptide ayant laltequence d'aminoacides illustree sur les figures 2A et 2B ( correspondant ft 

] f [ la pn§prorelaxine-H1 humaineT-*" 

(b) un polypeptide correspondant au polypeptide (a) avec un ou plusieurs aminoacides en moins; 

(c) un polypeptide correspondant au polypeptide (a) dans lequel un ou plusieurs aminoacides sont 
remplaces par des aminoacides differents; 

: 35 (d) un polypeptide correspondant au polypeptide (a) ft la sequence duquel un ou plusieurs 

aminoacides sont ajoutes; ou 

(e) un polypeptide fusionnft comprenant une sequence d'aminoacides consistant en totalite ou en 
partie, en la sequence d'aminoacides de la pr6prorelaxine-H1 humaine illustr6e sur les figures 2A et 2B, 
formant sa sequence C-terminale, et une partie d'une proteine procaryote formant sa sequence C- 
40 terminale. 

20. Fragment d'ADN codant pour un polypeptide ayant I'activite de la prorelaxine-H1 humaine, ce 
polypeptide fttant choisi parmi le groupe suivant: 

(a) un polypeptide ayant la sequence d'aminoacides illustree sur les figures 2A et 2B, correspondant ft 
la prorelaxine-H1 humaine; 

45 (b) un polypeptide correspondant au polypeptide (a) avec un ou plusieurs aminoacides en moins; 

(c) un polypeptide correspondant au polypeptide (a) dans lequel un ou plusieurs aminoacides sont 
remplaces par des aminoacides differents; 

(d) un polypeptide correspondant au polypeptide (a) ft la sequence duquel un ou plusieurs 
aminoacides sont ajoutes; ou 

ro (e) un polypeptide fusionne comprenant une sequence d'aminoacides consistant en totalite ou en 
partie, en la sequence d'aminoacides de la prorelaxine-H1 humaine illustree sur les figures 2A et 2B, 
formant sa sftquence C-terminale, et une partie d'une proteine procaryote formant sa sequence N- 
terminale. 

21. Fragment d'ADN isole, codant pour un polypeptide ayant I'activite de la relaxine-H1 humaine, ce 
55 polypeptide etant choisi parmi le groupe suivant: 

(a) un polypeptide ayant la sequence d'aminoacides illustree sur les figures 2A et 2B, correspondant ft 
la relaxine-H1 humaine; 

(b) un polypeptide correspondant au polypeptide (a) avec un ou plusieurs aminoacides en moins; 

(c) un polypeptide correspondant au polypeptide (a) dans lequel un ou plusieurs aminoacides sont 
eo remplaces par des aminoacides differents; 

(d) un polypeptide correspondant au polypeptide (a) ft la sequence duquel un ou plusieurs 
aminoacides sont ajoutes; ou 

(e) un polypeptide fusionne comprenant une sequence d'aminoacides consistant en totalite ou en 
partie, en la sequence d'aminoacides de la relaxine-HI humaine illustree sur les figures 2A et 2B, formant 

65 sa sequence C-terminale, et une partie d'une prof^e t jcaryote formant sa sequence N-terminale. 
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FK3.2A. 


P1G.2B. 


Fig.2 


*>• 

FK5.3A. 


FIG. 3B. 


FIG.3C. 


FIG. 30. 



Fig. J. 
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i 

I — Signal Peptide — 

Met Pro Are Leu Phe Phe «s Lw Leu 6Ui Phe Cys Leu Leu 

23g cS CGC Sg UUC UUGUUCCAC CUG CUA GAA UUt UGU UUA CUA 



10 20 
Vol lie Lys Leu Cy» Gly Arg Glu Leu Afg Ala Gin lie Ato 
GUU AUU AAA UUA UGC GGC CGC GAA UUA GUU CGC GCG CAG AUU GCC 



*„. aio Dm On Thr Pro Am Pro \W Ato Glu lie Vol Pro Ser 
GAU GCU CCU CAG ACA CCU AGA CCA GUG GCA GAA AUU GUA CCA UCC 

70 80 
II. Ala Asn Leu fn> Pro Glu Leu Lys Ata Ato Leu Ser Glu Arg 
AUU GCU AAU UUG-*CA CC6 GAG CUG AAG GCA GCC CUA UCU GAG AGG 

100 110 
Asd Ser Asn Leu Ser Phe Glu Glu Phe Lys Lys Leu lie Arg Asn 
GAU UCC AAU CUU AGC UUU GAA ,GAA UUU AAG AAA CUU AUU CGC AAU 

130 .pA-choin— ^ 



160 

Leu Ala Lys Tyr Cys ••• 

QJU GCU AAA UAU UGC UGA 

Fig. 2 A. 
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r— B-chain— 

-10 " 1 1 

Leu Asn Gin Phe Ser Arg Ala Nfal Ato Ata Ly» Trp Lys Asp Asp 

CUG AAC CAA UUU UCC AGA GCA GUC GC6 GCC AAA UGG AAC 6AC GAU 

i-C-peptkte—- 

lie Cys Gly Met Ser Thr Trp Ser Lys Arg Ser Leu Ser Gin Gtu 
AUU UGC GGC AUG AGC ACC UGG AGC AAA AGG UCU CUG AGC CAG GAA 

60 

Phe He Asn Lys Asp Thr GUi Thr lie lie He Met Leu 3u Phe 
UUC AUC AAC AAA GAU ACA GAA ACU AUA AUU AUC AUG UUG GAA UUC 

90 

Gin Pro Ser Leu Pro Giu Leu Gin Gin Tyr Vol Pro Alo Leu Lys 
CAA CCA UCA UUA CCA GAG CUA CAG CAG UAU GUA CCU GCA UUA AAG 

•*> 

120 

Arg Gin Ser GUi Ala Alo Asp Ser Asn Pro Ser GUi Leu Lys Tyr 
AGG CAA AGU GAA GCC GCA GAC AGC AAU CCU UCA GAA UUA AAA IMC 

150 

Ala Leu Phe Glu Lys Cys Cys Leu lie Gly Cys Thr Lys Arg fmr 
GUC^UWC^AAAUGUUaCUAAUUGOJU^ AAA AGG UCU 



Fig.2B. 
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■Signal Peptide 



*** •» »»• *»* »*• 



-20 



-20 



Pht 

UUC 


Uu Pht 

UUG UUC 


fe 

CAC 


Uu 

CUG 


Uu 
CUA 




• 




WW 


WWW 


uuc 

Pht 


ucc 

Sa- 


UAC 
Tyr 


cue 

Leu 


CUA 
Uu 



Glu Pht Cys 

GAA UUC UGU 



GGU GUC UGG 
G(y Mai Trp 




Lys Asp 


Asp 


VU 


nt 


Ly» 

AAA 


Uu 


AAG GAC 


GAU 


GUU 


AUU 


UUA 


* * *w 




trtt 




** 


* 


ACG AAC 


GAU 


uuu 


AUU 


AAG 


GCA 


Thr Asn 


Asp 


Pht 


lit 


Ly» 


Ala 



rW _ 

Cys Giy Arg Glu Ltu Vtat Ara 
UGC GGC CGC GAA UUA GUU CGC 
»** *** ** *** **» *» *» 

UGC GGC CGA GAA UUA GUC CGU 
Cys G(y Arg Gtu Uu Vol Arg 



30 

Arg S«r 

AGG UCU 
• 

ACU GCU 
Thr Ala 



Uu 


Is. 


Gta 


Qu 


r* 


AGC 


CAG 


GAA 


** 


*** 


* * 




cue 


agc 


CUG 


GAA 


Uul 




Uu 


Glu 



40 

Asp Ala Pro Gin Thr Pro Arg 
GAU GCU CCU CAG ACA CCU AGA 
** ** * * * * ** ** 
GAG CCU CAG CUG GAA ACU GGA 
Glu Pro Gin Uu tiu Thr Gly 



Pro 

CCA 
*« 

ccc 

Pro 



Irttron (3-7kb) cacotoxacrrrtftttfo 



/7a Ja 
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Asn [QnJPht Sr lArg IaIo VU 
AAC CAA WW UQCJ AGAfGCA GUC 

swion lUu Pre f Are IG(u lit 



B-thgp 



llyt Irp 



-1 

Ala Ala 

GCG GCC AAA UG6 
* » * » » 

CCA GGC.CAG AGU 
Pro G(y I On Sir 

-1 I 1 



Afa On Ik Ata 

GCG CAG AUU GOT 

* * * » 
CUB UGG GUG GAG 
Ui Irp VU GUi 




.1.:*. 



VU 

GUG 
* 

CCG 
Pre 



Ala G 

2J J °*W9cftaaoaxctacgocttfac 

GCAG 
Ala G 



.SOL 



** 



Il« VU I Pro Scrip** 
auu GUAjCCA urx uuc 



AA|A<X AUBICCA UCC OCC 
Thr MttfPro StrfSw 
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60 

lie lie 

AUA AUU 
** * 














70 


GAA 
*** 


Thr 

ACU 
* 


He 

AUC 
*★ 


Met Leu Glu Phe 

AUG .UUG GAA UUC 
*** *** *** ** 


lie 

AUU 
** 


Ala 

GCU 
** 


Asn Leu Pro 
AAU UUG CCA 

ititit irk it itirtc 


GAA 


AUC 


UUA AAG AUG 


AUG UUG 


GAA UUU 


GUU 


ecu 


AAU 


UUG CCA 


Gtu 


lie 


Leu Lys 


Met 


Met Leu 


Glu Phe 


Vol 


Pro 


Asn 


Leu Pro 



Leu 


Pro 


Gtu Leu 


Gin 


Gin 


Tyr 


Vbl Pro 


AlO 


Leu 


Lys 


Asp 


Ser 


UUA 


CCA 


GAG CUA 


CAG 


CAG 


UAU 


GUA CCU 


GCA 


UUA 


AAG 


GAU 


UCC 


* 


* 


«** *** 


me 


X* 




*• 


*** 


* * 


*** 


*** 


** 


CUG 


AGA 


GAG CUA 


CAA 


CAA 




ucu 


GCA 


UCA 


AAG 


GAU UCG 


Leu 


Arg 


Glu Leu 


Gin 


Gin 




Ser 


Ala 


Ser 


Lys 


Asp 


Ser 



Arg Gin 
AGG 



-....Ser 
CAA^AGU 



AGA CAA 
Arg Gin 



* * 

AAU 
Asn 



Gtu Ala 
GAA GCC 
*** #* 

GAA GCA 
Ou Ala 



Ala 
GCA 
* * 

GAA 

Glu 



Asp 
GAC 
•** 

GAC 
Asp 



120 

Ser Asn Pro Ser 

AGC AAU CCU UCA 
* *»*#** 

AAA AGU CUU UUA 
Lys Ser Leu Leu 



Glu Leu Lys 

GAA UUA AAA 
*** #»* *** 

GAA UUA AAA 

Glu Leu Lys 



Pro 


Tyr \tat Ala 


Leu 


Phe 


Gtu 


Ly» 


Cys Cys 


CCC 


UAC GUG GCA 


CUG 


UUU 


GAG 


AAA 


UGU UGC 


* 


** «* 


*** 




*** 


*** 


*»* ** 


UUC 


CGU AUG ACA 


CUG 


AGC 


GAG 


AAA UGU UGU 


Phe 


Arg Met Thr 


Leu 


Ser 


Glu 


Lys 


Cys Gys 



A- chain 



Leu lie 


Gty Cys 


CUA AUU 


GGU UGU 


* * * 


*** XX* 


CAA GUA 


GGU UGU 


Gin Vol 


Gty Cys 





Fig. JC. 
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Pro 


Gtu 


Leu 


Lys Ala 


Ab 


Leu Ser Glu 


Arg 


Gin 


Pro 


Ser 


CCG 


GAG 


CUG 


AAG GCA 


GCC 


CUA UCU GAG AGG CAA 


CCA 


UCA 


* * 


*** 


*** 




* 




*** 


■trtr* 






CAC 


GAG 


CUG 


AAG GCA 


ACA 


UUG UCU GAG AGG CAA 


CCA 


UCA 


Gin 


Gtu 


Leu 


Lys Ala 


Thr 


Leu Ser Glu 


Arg 


Gin 


Pro 


Ser 






100 














_TI0_ 


Asn 


Leu 


Ser 


Phe Glu 


Glu 


Phe Lys Lys 


Leu 


lie 


Arg 


Asn 


AAU 


CUU 


AGC 


UUU GAA GAA UUU AAG AAA 


CUU 


AUU 


CGC 


AAU 




*** 


* * 


*** *** 


*** 


*** *** *** 


** 


*** 


* 


** 


AAU QJU 


AAC 


UUU GAA 


GAA UUU AAG AAA 


AUU 


AUU 


CUU 


AAC 


Asn 


Leu 


Asn 


Phe Glu 


Gtu 


Phe Lys Lys 


lie 


lie 


Leu 


Asn 








1 100- 













A -chain 



UAC 

Mr 

AAC 
Asn 



Leu Gly Leu Asp 

UUA GGC UUG GAU 
*** *» .je* *** 

UUA GGU UUA GAU 

Leu Gly Leu Asp 



130 
Thr 


His 


Ser 


Gin 


Lys Lys 


Arg 


ACU 


CAU 


UCU 


CAA 


AAA AAG 


AGA 


* 


AAA 


** 


★ 


*** 


*** 


AAA 


CAU UCC 


AGA 


AAA AAG AGA 


Ly$ 


Hs 


Ser 


Arg 


Lys Lys 


Arg 



Arg 
CGA 

CUG 
Leu 



Thr 




Arg Ser Leu 


Ala 


Lys Tyr 


r 160- 
Cys 


XX* 


ACC 


AAA 


AGG UCU CUU 


GCU 


AAA UAU 


UGC 


UGA 


* * 


* * 


* * ** 


*** 


x ** 


*** 


x-xx 


AUC 


AGA AAA GAU AUU 


GCU 


AGA UUA 


UGC 


UGA 


lie 


Arg 


Lys Asp lie 


Ala 


Arg Leu 


Cys 


XX* 



Ftc. 3D. 
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